特徵工程,建模,訓練,預測Part3
Age欄位的預測
如何處理更多缺失值的欄位
Age缺值在Day13知道有263個,在整體1307筆資料中不少,之前提過fare的一個缺值可以直接平均填入,這邊可以用稱謂分組取中位數估計會比較準確,
像Miss,Lady,Mrs...年紀應該差不多
男生稱謂有:
"Mr.", "Sir.", "Dr.", "Major.", "Master."
女生稱謂有:
"Ms.", "Miss.", "Mrs.", "Lady."
各稱謂平均年紀跟存活率可以參考這個
ㄧ樣會在明天一起展示Day16
還有沒有其他隱藏特徵?
還有其他方法增加OOB嗎?
有除了特徵之外提升OOB的方法嗎?
https://medium.com/@yulongtsai/https-medium-com-yulongtsai-titanic-top3-8e64741cc11f